動物園之路 -17- 大象的肚子好大!-HDFS (續-Datanode)

DAY 17

動物園之路系列第 14 篇

鐵人賽 hadoop

fantasylight

2013-10-02 21:56:23

2692 瀏覽

分享至

昨天提到NameNode還有講解裡面存放的檔案代表什麼意思，接著來補上DataNode的部分，如同前面所提Hadoop是master/slave架構，datanode是可以一直擴展，也代表hdfs可以放更多的檔案。
今天也會補充為什麼可以確保檔案不會遺失~
首先來看到datanode上的目錄結構

datanode上的current目錄下，存放所有檔案的block，並且以blk_* 的方式來命名。
檔案有兩種類型，一種是blk_*,另一種是blk_*.meta，前者為檔案區塊的內容，後者為描述該區塊的metadata檔。前幾天有MapReduce的範例，其中有放一個1.1GB的檔案，被分成9個區塊(128MB)，我拿其中一個區塊做講解，-9178343734531892529，
他在datanode區塊上的檔案名稱叫做blk_-9178343734531892529，metadata為
blk-9178343734531892529_1092.meta。
metadata裡面存放的就是block的資訊。

可以看到<replicas></replicas>
這裡會放<replica><host_name>其中host_name就代表該block有存放在哪個datanode，該block有沒有損壞。